读书笔记 | 剑桥分析的成长史
“如果特朗普是一双雪地靴,那么让他当选总统就和让认为雪地靴很丑的人喜欢并购买它没什么差别,让一件商品流行和让一个候选人获胜是一样的,而政治就像时尚。”
2018年3月,政治数据分析公司剑桥分析前雇员克里斯托弗·怀利(Christopher Wylie)重磅爆料,唐纳德·特朗普在2016年美国总统大选期间雇用剑桥分析,在未经用户同意的情况下获取社交网络平台脸书(Facebook)上超数千万用户(经证实为8 700万用户,其中美国用户7 063万,超过北美地区活跃用户的三分之一)个人数据;此外,还有菲律宾、印度尼西亚和英国用户超100万用户被采集。剑桥分析将脸书用户数据与心理测量结果相结合,建立心理模型,分析用户的性格喜好和政治偏好等,它抓住选民的不同个性,定向精准推送政治广告,进行大规模的舆论引导、操纵和转向,有针对性地影响了2016年美国总统大选投票。
剑桥分析的CEO(首席执行官)亚历山大·尼克斯(Alexander Nix)在一次内部会谈时自称剑桥分析在2016年美国总统大选中全权负责特朗普的网络和电视竞选活动,并详述它如何帮助特朗普入主白宫,以及在世界各地使用色诱、伪造行贿视频等手段影响政治竞选。
剑桥分析开展工作的精妙之处在于它一系列的操纵多是隐蔽且不可追踪的,亚历山大·尼克斯表示,剑桥分析常常利用代理机构、慈善组织、网络大V、激进群体等发声,为公司传播信息,“我们要做的就是把信息注入网络的‘血液’,然后看着它持续发酵膨胀,再随着时间的推移不断地施加一些小的推动力,一段时间后就看着它成形了。”这些精心挑选过的内容会渗透网络社区并逐渐扩散,配合ProtonMail(加密电子邮箱)发送的自动定时销毁邮件,一切都没有痕迹,难以溯源,无法追踪。
剑桥分析这一诡秘崛起的数据公司究竟从何而来,这一切都要从这位叫作怀利的年轻人讲起……
剑桥分析的成长史
剑桥分析创立于2013年,总部位于伦敦牛津街55号,幕后老板为美国对冲基金文艺复兴科技公司CEO、共和党金主罗伯特·默瑟(Robert Mercer)。其官网曾明确宣称:“我们提供从预测选民行为到定向推送广告等一系列服务”,“我们会提供数据,帮助客户获取选票,赢得竞选”。
(一)剑桥分析的幕后老板罗伯特·默瑟
罗伯特·默瑟的主攻领域是人工智能(AI),他曾在1972年获得伊利诺伊大学香槟分校计算机博士学位,1993年,他加入由著名数学家詹姆斯·西蒙斯(James Simons)一手创建的文艺复兴科技公司,并利用算法决策投资对冲基金,并于2010年接替西蒙斯出任CEO。2014年,默瑟被授予ACL(国际计算语言学协会)终身成就奖,这是国际AI领域最高荣誉。
根据《华盛顿邮报》2015年一项评选显示,默瑟作为“对政界有影响力的十大亿万富翁之一,是美国政坛极具影响力的人物和金主,也是共和党阵营的幕后操盘手。作为共和党的忠实粉丝,默瑟曾为美国民粹和孤立主义领军人物史蒂夫·班农(Steve Bannon)掌控的布赖特巴特新闻网提供了上千万美元资助,并被其说服支持依靠民粹路线崭露头角的政坛新人特朗普,由此开启了剑桥分析制造政治操纵机器并帮助特朗普逆袭总统宝座的惊世之旅。
(二)剑桥分析数据分析方法的学术源头
现任剑桥大学心理测量中心副主任、心理学博士戴维·史迪威(David Stillwell)本科期间曾为脸书开发了一个基于心理学量表的性格测试小程序——Mypersonality。据统计,共有600万人使用了该程序并授权采集个人数据用于研究,这个包含了百万脸书用户性格数据和个人信息的数据库,后来成为剑桥分析的原初数据。
2012年,与史迪威同在剑桥大学心理测量中心的迈克尔·科辛斯基(Michal Kosinski)等5人组成研究小组,不断改进Mypersonality,探索量化测量研究人的性格特征。为此,他们发明了一种心理测量方法,即收集研究脸书用户的点赞(Like)数据。由于点赞数据默认是公开可见,研究小组得以将脸书用户对照片、好友动态,甚至体育、音乐、图书、餐馆等内容的喜恶充盈进用户个人数据库中。这样一来,研究小组就掌握了大量脸书用户点赞习惯、心理测验数据和个人信息,并能把用户的性格特征与行为喜好作进一步关联。2013年,史迪威等人发表重磅论文《个人行为和性格特质可以用数据来预测》,论文的利用脸书用户行为数据(主要是点赞数据)建立模型,预测用户性格和其他特质(性别、性取向、党派等),取得了较高的准确率。
为了进一步提高模型的准确性,研究小组还招募了七万余名志愿者及其亲朋好友参与实验。实验中,研究小组将志愿者的自我评定与计算机及志愿者亲朋好友的判断进行比较,检验志愿者自评与计算机及志愿者亲朋好友他评的一致性。结果发现,模型仅需100个点赞数据,判断的准确性就会超过他评的平均值;与同事、朋友、同居者、家人和配偶等他人的判断相比,模型分别需要10、70、150和300个点赞就能在准确性上超过他评。科辛斯基等人据此认为,点赞可以代表行为、态度和偏好,是可以有效预测个性心理特征的重要参数。
后来剑桥分析所使用的方法基本源自这篇论文。
(三)剑桥分析公司的创立
2013年,正在伦敦政治经济学院就读流行预测博士的克里斯托弗·怀利(Christopher Wylie)读到了史迪威等人的论文《个人行为和性格特质可以用数据来预测》,本就对大数据分析有着超常敏感性的他,立刻意识到海量网络行为数据建模能精准地预测用户性别、年龄、性取向、政治倾向、购买意愿等属性,相比于传统的问卷调查,网络行为数据不仅容易获取,而且准确率高。更让怀利豁然开朗的是,人格特质居然也可以作为政治态度的表征。
于是,怀利开始推销这项研究成果,并很快就碰到“识货”的英国SCL集团。SCL集团是一家致力于为全世界的政府、军事机构提供数据分析和策略的公司,曾参与社交媒体品牌和选民目标的军事虚假宣传活动,并在发展中国家帮助军队和政治家研究和操纵公众舆论和政治意愿。事实上,SCL集团的选举部门很早就开始使用社交媒体数据、数据经纪公司提供的第三方数据及机器算法,构建了不少国家民众的“心理变数资料”,通过了解每个民众对具体问题的全面观点,判断其投票倾向,并有针对性地提供信息,以影响和操纵选举结果。
怀利提供的包含人格特质的心理操纵服务被SCL集团看作一次创新,它通过掌控和支配个人性格数据,采取包括制造和传播谣言、传言、流言等在内的手段,非常规地说服和改变人们想法。
2013年底,怀利和班农见面,两人一致认为政治处于文化的下游,和社会文化紧密相连,想要改变政治,先得改变社会文化,而流行是一个有效的文化代理。社交媒体是一个极好的平台,可以利用社交媒体数据分析技术,针对每个选民投放不同政治内容的广告,潜移默化地影响每个人的思想观点和投票倾向。
相见恨晚的两人一拍即合,怀利随即被班农引荐给默瑟,默瑟家族一直试图把已在商业领域被证明有效的数据操纵引入政治领域,让数据分析为政治服务,通过数据潜移默化地影响每个选民的思想,改变美国政治格局,打一场高规格的思想操纵战。为此,默瑟出资1 500万美元,联合SCL集团,聘请亚历山大·尼克斯担任首席执行官,班农担任副总裁,剑桥分析正式开张。为了帮剑桥分析收集和分析数据,他们还成立了全球科学研究公司(GSR)。
此后,包括万事达卡、纽约扬基队、美国参谋长联席会议等知名企业机构均成为剑桥分析客户,包括英国脱欧、美国大选在内的多个重大事件中,据信都有剑桥分析的身影。
(四)剑桥分析的垮台及裂变
2014年,怀利离开SCL公司。两年后,他走到聚光灯下,向英国《卫报》曝光了剑桥分析背后的秘密工作,引发全球震动。
2018年3月,随着媒体陆续曝光剑桥分析非法获取和使用数据的行为,剑桥分析董事会暂停了尼克斯的工作。5月,剑桥分析及SCL选举公司停止运营,启动破产程序。
然而,就在剑桥分析被曝光后不久,在世界各地,由剑桥分析员工、股东成立的数据分析和心理测量公司已是遍地开花。2016年,曾是剑桥分析兼SCL集团选举部门重要员工的数据科学家创办Genus AI,用人工智能技术整合第三方信息和一手数据。不久,Genus AI技术顾问托比亚·克罗珀创办Whitehat Analytics公司,并在科学数据分析平台Aigenpulse担任CEO。2017年,由剑桥分析原股东、SCL首席执行官投资的Emerdata Limited公司也在英国完成登记。2018年,美国Cloud Commerce公司CEO安德鲁·范诺伊(Andrew Vannoy)成立政治咨询公司Data Propria,提供与剑桥分析类似的服务,聘请剑桥分析前产品负责人马特·欧兹科夫斯基(Matt Oczkowski)为高管,使用包括依据心理学数据分析选民、根据选民态度喜好和其他心理特征调整投放广告或营销策略的方式操纵选举。
也就在Data Propria成立前一年,Cloud Commerce收购了后来作为特朗普竞选经理的布拉德·帕斯卡尔(Brad Parscale)的数字营销公司Giles Parscale,也就是这家公司,在2016年美国总统大选中,帮助特朗普在数字媒体、在线筹款以及传统媒体策略中赢得上风。此外,Giles Parscale还被公认曾基于社交媒体实验制作发布社交媒体广告,以最大限度确保特朗普的社交媒体出镜率并获取支持和在线捐赠,广告精准度之高,甚至包括封面领导人的表情、字体、颜色和口号等内容的考究。
2018年4月,一家号称在全球范围内有超过4 500万用户的数据公司CubeYou被曝光曾通过发布“用于非营利研究项目”的心理测试小程序来收集Facebook用户数据,手段与剑桥分析极其类似。据悉,CubeYou使用的是剑桥大学心理测量中心的理论和模型,它通过分析Facebook用户点赞、关注、分享、发帖、评论等数据对用户进行画像,并对用户姓名、年龄、职业、受教育程度、家庭信息、邮件地址、电话号码等信息进行采集,以确保广告代理商的广告服务被精准投放给受众。
多年以来,剑桥分析及SCL集团虽已宣告破产,但其算法、数据、模型始终存在,剑桥分析的始作俑者班农、默瑟家族也都还活跃于政治领域,其核心员工也早已洗白上岸,并且在全球各地开枝散叶。
大数据时代,数据不仅是重要的商业资源,更是带有基础性、关键性等特点的国家战略资源。国家利用大数据,可以实现对经济社会活动及民众言行的精准分析把控。可是一旦政治力量雇用大数据公司投放政治广告大搞政治营销,它不仅将能够隐蔽地影响政治议程和走向,甚至可以用极低的成本改变政治态势,进而影响一国乃至国际局势。
数据安全不仅事关公民个人权益保护,而且与国家政治、经济、文化、军事等诸多领域安全的关系直接相关,将是下一个百年影响国家安全和国家治理的新因素。
※原作《操纵:大数据时代的全球舆论战》 中璋著
- End -